热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

论文简述|融合关键点和标记的基于图优化的可视化SLAM

点击上方“3D视觉工坊”,选择“星标”干货第一时间送达1摘要同步定位与建图在移动机器人自主导航中起着重要的作用.大多数视觉SLAM方法使用关键点进行跟踪,但由于光线条

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

1

摘要

同步定位与建图在移动机器人自主导航中起着重要的作用.大多数视觉SLAM方法使用关键点进行跟踪,但由于光线条件不确定和视点频繁变化,其性能受到任务中不稳定地标的影响.对于低纹理环境中的视觉SLAM,尤其是在室内建筑中,这种情况变得更糟,在室内建筑中,辅助人工标记可以用于在更大范围的环境下提高鲁棒性检测.受这一思想的启发,本文开发了一个集成关键点和人工标记的可视化SLAM系统.构建了一个图形优化问题,通过考虑关键点的重投影误差和标记的影响来优化轨迹.在SPM数据集上的实验结果表明,与最先进的ORB-SLAM2相比,该图优化算法具有更高的精度.

2

介绍

MonoSLAM是第一个基于Andrew Davison提出的扩展卡尔曼滤波器(EKF)的单目摄像机视觉SLAM, 其主要思想是利用状态向量存储摄像机姿态和地标的三维坐标[1]. 进一步用概率密度函数表示不确定性, 通过观测模型和递推计算最终得到更新状态向量的均值和方差.然而随着姿态和界标的增加,这种基于滤波的方法受到高计算复杂度的极大影响,表明其对于大场景的不足,从而逐渐被基于图优化的方法所取代[2] [3].图形优化算法需要建立一个姿态图,通过边缘化的方法将环境中的地标观测转化为机器人不同姿态之间的约束,从而可以估计机器人的姿态序列和环境中地标的位置序列,简化优化过程.姿态图中的顶点对应机器人的姿态和每个时刻地标的位置,边表示顶点之间的相对约束.通过不断调整顶点的姿态以满足约束,最终得到机器人的轨迹和观察到的环境图.PTAM是第一个在后端使用非线性优化的解决方案[4].通过使用关键帧机制,优化了轨迹和地图,提高了计算速度和定位精度.许多视觉SLAM方法都是基于关键点的,本质上是提取特征点进行匹配和估计,如PTAM,ORB-SLAM2 [5,6].然而,这些自然标志对快速运动或视点的大变化不稳定[7].伊翁·林和年轻的萨姆提出了一种方法,利用EKF估计机器人的姿态和人工地标的位置[8].SPMSLAM的提出为SLAM的解决方案提供了方形平面标记,显示出更鲁棒、精确和快速.

本文提出了一种融合关键点和标记的视觉SLAM来处理低特征环境.受文献[2]的启发,构造了一个图优化问题来优化地标的轨迹和位置.在SPM数据集上的实验结果表明,与ORB-SLAM2算法相比,该算法具有更高的精度.

3

实验

该部分基于包含30 Hz帧频的单目彩色图像和摄像机的地面真实度的SPM数据集验证了所提出的算法.这些数据集是在室内场景中手工收集的,那里的墙上有许多ArUco [10] [11]标记.正方形标记的边长为0.165米,标记检测采用ArUco库,通过AruCo库可以得到标记中心相对于摄像机的旋转和平移.标记的四个角点的空间坐标可以如图2所示计算,便于我们的测试

图2: ArUco标记, 边长2s. 标记中心的旋转和平移可以通过ArUco库获得

该算法是用g2o语言用C++开发的.实验是在一台配备英特尔i57200U处理器和12GB内存的笔记本电脑上进行的. 为了评估的目的, 将所提出的算法与ORB-SLAM2进行了比较. 由这两种算法优化的全部轨迹等如图3所示.

图3:轨迹曲线. 蓝色曲线、绿色曲线和虚线分别对应于ORB-SLAM2、我们的方法和地面真相的轨迹

从图3的轨迹曲线可以看出,ORBSLAM2算法和我们的算法都可以跟踪摄像机的运动.摄像机在室内环境中不停地运动不止一圈,包括旋转和平移.整个过程持续了112.6秒. x轴、y轴和z轴轨迹上的相应误差如图4所示,从中可以直观地观察到,我们的轨迹比对应的轨迹更接近地面真实.

图4:各轴的轨迹.蓝色曲线、绿色曲线和虚线分别对应于ORB-SLAM2、我们的方法和地面真实的轨迹.

图5:绝对位姿误差(APE), 直接由地面真值与SLAM系统估计值之差计算得到.

为了更准确地反映轨迹误差,从地面真实值和每个SLAM系统的估计值之间的差异进一步计算绝对姿态误差(APE).每个SLAM系统的时间戳首先与groundtruth对齐,然后计算每对姿态之间的差异.APE曲线如图5所示.总体趋势表明,该方法优于ORBSLAM2, ORBSLAM2系统的平均绝对位姿误差为0.1392 m, 位姿误差降至0.0721 m. 此外与ORB-SLAMM 2系统相比,所提出的可视化SLAM算法能够提供更小的标准偏差和均方根误差在图6,实验结果表明,融合关键点和标记的视觉SLAM能够提供更准确的位置估计.

图6:具体指标,包括APE的标准差、均方根误差、最小误差、中值误差、平均误差、最大误差.

4

结论

本文提出了一种基于图形优化的融合关键点和标记的可视化SLAM系统. 原始SLAM系统的cost函数只有重投影误差,因此在快速运动或低纹理环境中定位精度较差.利用比自然标志更稳定的人工标志,在姿态图中构造标志的代价函数和添加标志顶点,使得这些具有关键点重投影误差的顶点可以一起优化, 提高了系统的精度. 

在SPM数据集上的实验结果表明,与ORB-SLAM2相比,该方法具有更高的准确率.然而这种方法本质上是基于关键点的.因此,可以在未来的工作中考虑对象级的SLAM,从而可以识别特定的对象,例如椅子或桌子,并且通过将目标顶点添加到姿态图中来构造对象的成本函数.这种方法可以帮助进一步提高系统的定位精度,因为对象比关键点更稳定,并且不需要在环境中手动实现放置标记.

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉,即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总,即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定,即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配,即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  



推荐阅读
author-avatar
jimscloudy
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有